草庐IT

python - 在python中解析结构化文本文件

全部标签

ruby - 我如何 robuSTLy 解析格式错误的 CSV?

我正在处理来自政府来源(FEC、州选民数据库等)的数据。它的格式不一致,以各种令人愉快的方式破坏了我的CSV解析器。它是外部来源和权威的。我必须解析它,我不能让它重新输入、在输入时验证等等。就是这样;我不控制输入。属性:字段包含格式错误的UTF-8(例如Foo\xABbar)行的第一个字段指定已知集中的记录类型。了解记录类型,您就会知道有多少个字段以及它们各自的数据类型,但直到您知道为止。文件中的任何给定行都可以使用带引号的字符串("foo",123,"bar")或不带引号的字符串(foo,123,bar)。我还没有遇到它在给定行中混合的任何地方(即"foo",123,bar),但它可

ruby - 使用 FasterCSV gem 克服 CSV 解析的基本问题

我发现了FasterCSV(1.5.0)的CSV解析问题,这似乎是一个真正的错误,但我希望有一个解决方法。基本上,当字段用引号引起来时,在分隔符后添加一个空格(在我的例子中是逗号)会生成MalformedCSVError。这是一个简单的例子:#Noquotesonfields--worksfineFasterCSV.parse_line("one,two,three")=>["one","two","three"]#Quotesaroundfieldswithnospacesafterseparators--worksfineFasterCSV.parse_line("\"one\",

ruby - ruby 是否提供显示层次结构调用的方法?

就这些了,我想看看继承固定类的类有哪些。Ruby中有这样的方法吗?Aptana提供了一个选项来显示这一点,但是有什么方法吗?谢谢 最佳答案 你是要查看一个类的所有祖先,还是后代?对于祖先,使用:Class.ancestors然而,对于后代,没有可比的“开箱即用”的方法。您可以使用ObjectSpace,如下所示,但它很慢并且可能无法跨Ruby实现移植:ObjectSpace.each_object(Class)do|klass|pklassifklass编辑:也可以使用Class#inherited钩子(Hook)跟踪子类化。但是,

Ruby CSV 解析带有转义引号的字符串

我的CSV文件中有一行包含一些转义引号:173,"Yukihiro\"TheRubyGuy\"Matsumoto","Japan"当我尝试使用RubyCSV解析器解析它时:require'csv'CSV.foreach('my.csv',headers:true,header_converters::symbol)do|row|putsrowend我收到这个错误:.../1.9.3-p327/lib/ruby/1.9.1/csv.rb:1914:in`block(2levels)inshift':Missingorstrayquoteinline122(CSV::MalformedCS

ruby - 如何解析 URL 并提取所需的子字符串

假设我有这样一个字符串:"http://something.example.com/directory/"我想做的是解析这个字符串,并从字符串中提取"something"。第一步,显然要检查以确保字符串包含"http://"-否则,它应该忽略该字符串。但是,我如何才能提取该字符串中的"something"?假设这将要评估的所有字符串都具有相似的结构(即我正在尝试提取URL的子域-如果正在检查的字符串确实是一个有效的URL-其中有效以"http://").谢谢。附言我知道如何检查第一部分,即我可以简单地在"http://"处拆分字符串,但这并不能解决全部问题,因为这会产生"http://

ruby-on-rails - 在带有 HTTPParty 的 Controller 中解析 JSON

在我的Controller中,我有以下代码...response=HTTParty.get('https://graph.facebook.com/zuck')logger.debug(response.body.id)我收到一个NoMethodError/undefined方法`id'如果我这样做...logger.debug(response.body)它按预期输出...{"id":"4","name":"MarkZuckerberg","first_name":"Mark","last_name":"Zuckerberg","link":"http:\/\/www.faceboo

ruby-on-rails - Rails 如何解析文本/事件流?

我有一个APIurl,它是内容类型为数据流的:text/event-stream。怎么可能收听流?喜欢订阅每个事件来打印数据?我尝试使用ruby​​库em-eventsource我的test.rb文件:require"em-eventsource"EM.rundosource=EventMachine::EventSource.new("my_api_url_goes_here")source.messagedo|message|puts"newmessage#{message}"endsource.startend当我访问我的apiurl时,我可以看到每秒更新的数据。但是当我在终端中

ruby - Python 程序员通过学习 Ruby 可以获得什么?

我打算在大学学习Ruby、Haskell和Prolog。现在,我想知道什么应该引起我的大部分注意。我有半年的时间来完成这三门类(class),这意味着我需要选择一种语言来获得我的课外时间。其他我将学习的内容足以在类(class)中做得很好。我对Haskell和Prolog非常熟悉,知道学习它们会教会我一些非常重要的计算机科学概念。我不太确定ruby。通过一些教程和介绍,我觉得ruby​​是很多肤浅的魔法。现在我问ruby​​的人:如果我决定不再使用它,我会得到什么,在我花了半年时间学习它之后,Python还没有教我。虽然我意识到这是一个很有争议的潜在话题,但这个问题并不是为了“证明”r

ruby - 解析 HTTParty 响应

我正在使用HTTParty提取Facebook用户的图书列表,但我在解析响应时遇到问题:Facebook以这种方式返回数据:{"data":[{"name":"Title","category":"Book","id":"21192118877902","created_time":"2011-11-11T20:50:47+0000"},{"name":"Title2","category":"Book","id":"1886126860176","created_time":"2011-11-05T02:35:56+0000"},然后HTTParty将其解析为ruby​​对象。我试过

ruby - 如何在 Nokogiri/Ruby 解析期间检查页面上是否存在元素?

在使用Nokogiri(Rubygem)解析HTML页面期间,我如何检查页面上是否存在元素(在本例中为div)?在我的测试页面上,它确实存在,因此pp会产生预期的Nokogiri输出。但是if语句不起作用,==true似乎是错误的方法。有什么改进建议吗?干杯,克里斯pppage.at('.//div[@class="errorMsg"]')ifpage.at('.//div[@class="errorMsg"]')==truethenputs"Errormessagefoundonpage"end 最佳答案 与true比较不是正确的